文本检索

ICML 2025 | 从联合空间到文本空间:测试时增强跨模态检索新范式

语义冗余:联合空间的全局对齐会把与语义无关的底层视觉因素一并拉近,淹没真正有用的语义线索。例如雪地纹理、树枝线条、水面反光、舞台灯光等,检索时易出现“背景相似但语义不对”的假阳性;在视频场景中,也会出现时序冗余。粒度错配:图像/视频天然具有“无限粒度”,而弱标

模态 范式 文本检索 qa icml 2025-09-26 09:29  4